جستجوی کلمات کلیدی در رشته ی گفتار

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
  • نویسنده هادی نادری
  • استاد راهنما حسین مروی
  • سال انتشار 1391
چکیده

تشخیص کلمات کلیدی یا keyword-spotting در حالت کلی به معنای یافتن یک کلمهی کلیدی در یک پروندهی نوشتاری و یا گفتاری است. در این تحقیق، یک روش جدید تشخیص یا بازشناسی کلمات کلیدی در زبان فارسی، در دوحالت پیوسته و گسسته معرفی شده است. در هر دوحالت تشخیص کلمات کلیدی در گفتار پیوسته و گسسته، از روش dynamic time warping(dtw) استفاده شده است که با سیستمهایی که بر اساس مدل مخفی مارکوف طراحی شده و امروزه به طور گسترده از آنها استفاده میشود، متفاوت هستند. روش ارائه شده برای تشخیص کلمات کلیدی در حالت پیوسته، بر پایهی حالت اصلاح شدهای از روش قدیمی dynamic time warping است، که یک روش ابتدایی برای محاسبهی میزان شباهت دو دنبالهی متغیر با زمان است. در مرحلهی پردازش، سیگنال گفتار به فریمهایی با طول کم تقسیم میشود. هر فریم به صورت یک بردار کوانتیزه شده از ویژگیها نمایش داده میشود. هم کلمهی کلیدی و هم گفتار اصلی که جستجو در آن انجام میشود، به صورت دنبالهای یک بعدی از اندیسهای کتاب کد تبدیل میشوند. سپس دنبالهی اندیسهای گفتار اصلی به چندین جزء تقسیم شده و فاصلهی هرکدام از این بخشها طبق معیار dtw با اندیسهای کلمهی کلیدی بدست میآید. برای هر بخش یک امتیاز اعوجاج محاسبه میشود و بخشی که کمترین امتیاز اعوجاج را داشته باشد، به عنوان محل احتمالی حضور کلمهی کلیدی معرفی میشود. در روش ارائه شده برای تشخیص کلمات کلیدی در حالت گسسته نیز از روش dtw استفاده شده است. در این حالت، ابتدا از نمونههای مختلف از یک کلمهی کلیدی خاص که توسط یک یا چند گوینده بیان شدهاند و دارای طول متفاوت هستند، بردارهای ویژگی را استخراج کرده و سپس کلمهای که دارای کوچکترین طول است را به عنوان نمونهی مرجع انتخاب میکنیم. سپس با استفاده از روش dtw، مسیر همترازی نمونهی مرجع و سایر نمونهها را بدست آورده و از روی مسیر همترازی، ابعاد ماتریس ویژگی سایر نمونهها را هم بعد با نمونهی مرجع میسازیم. در نهایت از ماتریس ویژگی تمام نمونهها، میانگین میگیریم تا یک نمونهی مرجع عام برای هر کلمهی کلیدی بدست آید. در ادامه از این نمونهی مرجع عام در فرایند تشخیص استفاده میکنیم.

منابع مشابه

ارائه روشی برای استخراج کلمات کلیدی و وزن‌دهی کلمات برای بهبود طبقه‌بندی متون فارسی

Due to ever-increasing information expansion and existing huge amount of unstructured documents, usage of keywords plays a very important role in information retrieval. Because of a manually-extraction of keywords faces various challenges, their automated extraction seems inevitable. In this research, it has been tried to use a thesaurus, (a structured word-net) to automatically extract them. A...

متن کامل

انتخاب بهینه ی کلمات کلیدی برای موتور های جستجو

به طور کلی، روش های ارائه شده جهت استخراج خودکار کلمات کلیدی، سعی در بدست آوردن نتایج بهتر در معیارهایی مانند بازخوانی و دقت دارند. اگرچه این معیارها، میزان کارایی روش استخراج کلمات کلیدی در نقش یک انسان را نشان می دهد اما با توجه به نقش غیرقابل انکار موتورهای جستجو در دنیای امروز، به نظر می رسد که در انتخاب کلمات کلیدی علاوه بر توجه به معیارهای رایج بازیابی اطلاعات باید به افزایش میزان دسترسی ...

15 صفحه اول

ارزیابی تراکم کلمات کلیدی در وب سایت های برتر کتابخانه مرکزی دانشگاه های علوم پزشکی ایران

امروزه وب، اصلی‌ترین ابزار دسترسی و اشاعه اطلاعات به شمار می‌رود، به گونه‌ای که کتابخانه‌ها و مراکز اطلاع‌رسانی، بسیاری از خدمات خود را از طریق وب به کاربران ارائه می‌دهند. بررسی‌ها حاکی از آن است که توانایی وب‌سایتها در تبلیغ و بازاریابی خدمات کتابخانه‌ها و مراکز اطلاع‌رسانی به اثبات رسیده است. از دلایل اصلی موفقیت در بازاریابی، امکان بازیابی سریع و دقیق اطلاعات از وب‌سایت کتابخانه‌ها ...

متن کامل

ارائه روشی جدید برای شاخص‌گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه‌بندی متون

Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...

متن کامل

مقایسه ی درک نوای غیرعاطفی (زبانی) گفتار در دو جنس

توانایی های گفتاری مردان با زنان متفاوت است. هدف از این مطالعه، بررسی تفاوت دو جنس در درک نوای غیر عاطفی (زبانی) گفتار است. این مطالعه به صورت مقطعی- مقایسه ای بر روی 50 نفر در دو گروه مرد و زن صورت گرفت. پاسخ هر یک از گروه های مورد بررسی به مجموعه آزمون های تهیه شده ثبت شد. محرک های مورد استفاده در این پژوهش، جملات غیرعاطفی (سوالی، امری و خبری) بودند که به صورت معنی دار، بی معنی و فیلتر شده در...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023